İnsan ve Makine Bulutları Sinerjisi: Kitle Kaynaklı Çalışma ile Veri Temizleme Örnek Uygulaması

نویسندگان

  • Deniz Iren
  • Gökhan Kul
  • Semih Bilgen
چکیده

Öz. Kitle Kaynaklı Çalışma (KKÇ) ve Bulut Bilişim bilgi teknolojilerinde önem kazanan kavramlar arasında yer almaktadır. İnsan ve makine bulutlarının karma kullanımıyla bir sinerji oluşturulması ve bu şekilde iki dünyanın güçlü tarafları öne çıkarılırken zayıf noktalarının da üstesinden gelinmesi mümkün kılınabilir. Bu makale Orta Doğu Teknik Üniversitesi’nde kullanılmakta olan, ancak kullanım ömrünü tamamlamaya yakın bir akademik yayın kayıt takip yazılımının güncel sürümünün geliştirilmesi sürecinde karma bir çözüm kullanımını konu almaktadır. Bu yöntem yazılımın yeni sürümünün geliştirilmesine paralel olarak, kayıtlı tutulan büyük miktarda verinin temizlenerek yeni sisteme aktarılmasında kullanılmıştır. Veri aktarımı için geliştirilmiş olan kullan-at prototip sistem ile 53,822 akademik kayıt temizlenmiş ve aktarılmıştır. Bu çözümün ilk adımı harici web servislerinden Sayısal Nesne Kimliği (Digital Object Identifier) sorgulanması ve kayıtların etiketlenmesinden oluşmaktadır. İkinci adımda ise bu çözüm için özel tasarlanmış dizgi benzerlik algoritması ile kalan kayıtlar filtrelenmiştir. Son olarak benzer ancak birebir aynı olmayan kayıtlar KKÇ yöntemi kullanılarak analiz edilmiş ve veri kümesindeki tekrarlar elenmiştir. Bu karma yöntem sayesinde projede, yalnızca makinelerin kullanıldığı bir çözüm ile ulaşılamayacak bir doğruluk seviyesine erişilebilmiş ve iş yalnızca insanların kullanıldığı bir çözüm ile erişilemeyecek bir hızda sonuçlanmıştır. Çözümün KKÇ fazında ulaşılan hata payı 6.4% olarak gözlemlenmiş ve insan ve makine bulutlarının sinerjisine Türkiye’deki kamu üniversitelerinde bir ilk örnek olan bu çalışmanın başarısı belgelenmiştir.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Polarization Measurement of High Dimensional Social Media Messages With Support Vector Machine Algorithm Using Mapreduce

Bu çalışmada önerilen yöntem kullanılarak, Eşle/İndirge (MapReduce) tekniği ile özellikle TFxIDF yöntemi gibi yüksek boyutlu veri setlerinin, veri madenciliğinde oldukça sık kullanılan makine öğrenme algoritmalarından olan Destek Vektör Makinesi (DVM) ile uygulanabilirliğini anlatılmaktadır. Literatürde, DVM sınıflandırma algoritması, makine öğrenmesi yöntemleri arasında genelleştirme özelliği ...

متن کامل

Android Uygulamaları Bellek Hataları Yakalanması ve Etkileri

Öz: Günümüzde mobil uygulamalar oldukça yaygın kullanılmakta, birçok kurum servislerini mobil alanlara taşımaktadır. Bu uygulamalar için diğer yazılımlardan farklı gereksinimler bulunmaktadır. Bunların en başta gelenleri bellek kısıtı ve işlemci kullanımıdır. Bellek sızıntısı olan, hızlı yanıt veremeyen uygulamalar kullanıcı memnuniyetini düşürmektedir. Kullanıcıların mobil uygulamadan kolay va...

متن کامل

Yazılım Kalitesi ve İnsan Faktörü Arasındaki İlişkinin Değerlendirilmesi

Özet. Yazılım projelerinde, başarı ve kaliteyi teknoloji, insan, süreçler, çevre gibi dört ana etken etkilemektedir. İnsan ise, diğer etkenleri kullanan, çıktıları ortaya çıkaran başroldür. İnsan faktörleri ile kalite arasında birçok çalışma yapılmıştır, fakat bu çalışmalar yazılım sektöründe çok fazla değildir. Bu bildiri de yazılım sektöründe çalışan insan faktörleri ile yazılım kalitesi aras...

متن کامل

Kullanım Eşlemesiyle Mimari Görünümlerin İrdelenmesi Üzerine Bir Örnek Çalışma

Özet. Karmaşık yazılım-yoğun sistemlerin davranışını betimlemek ve anlamak amacıyla kullanılan yöntemlerden biri Kullanım Eşlemesi (Use Case Map UCM) gösterimidir. Gereksinimler ve kullanım durumları doğrultusunda ortaya çıkan senaryoları mimari bileşenlerle eşleştirmek, dolayısıyla sistem davranışlarını daha iyi açıklamak ve analiz etmek amacıyla UCM kullanılır. Bu çalışmada ise örnek çoklu or...

متن کامل

Melez Erişim Denetimi için bir Mimari Önerisi: İK Uygulaması Örneği

Özet. Anlamsal web, web içeriklerinin diğer yazılımlar tarafından anlaşılabilir, yorumlanabilir, kullanılabilir olmasını ve bilginin paylaşılmasını amaçlamaktadır. Anlamsal web’de bilginin güvenliği erişim denetimi ile sağlanmaktadır. OBAC(Ontology Based Access Control – Ontoloji Tabanlı Erişim Denetimi) verinin anlamsal tanımının olduğu ontolojilere erişim denetiminin sağlanmasında kullanılan ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2014